import re
#分组

# 匹配数字0-100数字
n = '100'
'''
    | 或者
    () 小括号整体匹配 与[abc|123] 后面的只匹配一个单次
'''
res = re.match(r'^([1-9]?\d$)|100$', n)
print(res)

# 验证输入的邮箱 163 126 qq
email = '1232111113@qq1.com'
res = re.match(r'^\w{5,20}@(126|163|qq)\.(com|cn)$', email)
print(res)

# 不是以47结尾的手机号（11位）

phone = '13568956241'
res = re.match(r'^1[356789][0-9]{8}[0-35-689]$', phone)
print(res)

# 爬虫
phone = '0123-12345678'
res = re.match(r'^(\d{3}|\d{4})-(\d{8})$', phone)
print(res.group(1))
print(res.group(2))

msg = '<html><h3>123</h3></html>'
msg1 = '<h2>dsf</h2>'

res = re.match(r'<\w+>(.+)</\w+>', msg)
print(res.group(1))
'''
<(\w+)>(.+)</\1>$ 

通过\1进行前后匹配
'''
res = re.match(r'<(\w+)>(.+)</\1>$', msg)
print(res.group(1))
print(res.group(2))